睡眠中的神经优化

本文节选自:彼得·沃兹尼亚克(2017)所著的《睡眠的科学

睡眠作为神经优化器

所有能够通过关闭测试睡眠理论,都与睡眠似乎最主要的功能相容:神经优化

一系列理论指出,睡眠是一种神经优化器。神经网络会在一夜之间被重新接线。记忆会从一种临时的、容量低、编码快、关联快、抗干扰强的存储,迁移到那些可以在数月乃至数年内安全使用的区域,而几乎不受新编码记忆带来的干扰。抽象模式会被提取出来,而遮蔽整体图景的细节则被丢弃。

睡眠与记忆

NREM 与记忆

NREM 睡眠拥有魔法般的力量!如果你只睡着几分钟,并设法进入更深的睡眠阶段,你很可能醒来时感觉大脑焕然一新。显然,这样的短暂小睡只有在时机合适且自然醒来的情况下才可能发生。然而,短暂的 NREM 对学习的影响令人震惊。要让大脑在稳态上变得困倦,需要许多个小时的高强度学习;而只需要几分钟的 NREM 睡眠,就能把这种困倦带走。

SuperMemo 中的双过程模型展示:19 分钟午睡如何让警觉性的稳态成分(绿色线)几乎翻倍

图: 睡眠的双过程模型SuperMemo 中展示:19 分钟午睡如何让警觉性的稳态成分(绿色线)几乎翻倍。这个理论模型得到了多年睡眠与学习数据的支持。

这种效应如此强大,以至于关于 Uberman 睡眠的整套神话都建立在这一基础之上。哪怕只睡几分钟,也足以让大脑获得充分的恢复,从而至少再工作几个小时。显然,NREM 的力量只是整体图景的一部分。不过,在这段简短的章节里,我想窥探一下我们目前对 NREM 对记忆影响的认识。

NREM 与海马体清理

关于 NREM 睡眠功能的最有说服力的假说,将其描绘为这样一个过程:存放在临时存储(主要是海马体内嗅皮层及其相邻结构)中的短期新颖记忆,会被以最优方式写入新皮层存储的庞大网络之中(Born and Marshall 2007[116])。海马体连接大脑的不同区域,以形成快速的记忆联结。例如,当我们学习一个新的法语单词时,它可能会把某个概念或其英语表达,与新的法语发音、文字或一组音节关联起来。这个海马体的记忆交换机(switchboard)自然是有容量上限的。这就是为什么它需要周期性地被清空,使得英语与法语单词之间的新连接能够在更慢、更复杂的新皮层存储中被建立起来。该假说认为,这件事发生在 NREM 睡眠中,并且发生得相当快。科学家很早就注意到:在慢波睡眠期间,海马体网络与新皮层网络往往会重放与新体验相关的放电模式(Wilson and McNaughton 1994[117])。这引出了一个怀疑:海马体可能会用新学到的信息(包括新的法语词汇)来「演练」新皮层。要理解这种训练可能如何完成,就需要更多了解神经网络的性质,以及它们如何在探索性活动(如学习)期间与 theta/gamma 振荡同步放电,并在摄取性活动(深睡)期间出现 SWP/200 Hz 的涟漪爆发(Buzsaki 1996[118])。

NREM 与陈述性记忆

关于 NREM 睡眠与记忆的研究彼此矛盾,且并不完全符合上文描绘的那幅整洁图景。每个人都能在 SuperMemoSleepChart 中看到睡眠的力量:哪怕只是短暂小睡,也能让学习中的回忆巩固回到基线水平。与 NREM 睡眠相关的睡眠纺锤波与「感觉恢复了多少」的程度高度相关(Goetz et al. 1983[119])。但这并不能说明海马体的功能、睡眠中大脑的内部工作机制,更不用说 NREM 睡眠本身了。Takashima 注意到:小睡时长与之后的记忆表现呈正相关,而与检索时记录到的海马体活动呈负相关(Takashima 2006[120])。这可能表明:即便是短暂小睡,也能降低海马体的记忆负荷。另一些研究者指出:在空间学习之后,慢波睡眠期间海马体的活动量,与隔夜的表现提升成正比(Peigneux 2004[121])。许多实验都观察到:慢波睡眠剥夺陈述性记忆的影响大于对程序性记忆的影响(Plihal and Born 1997[122])。骑自行车是一项依赖程序性记忆的技能例子,而教科书知识在本质上是陈述性的。换言之,考试前减少睡眠,会实质性地使得「记住为考试学到的知识」变得更困难。这种效应在长期上尤为明显;也就是说,在考试当天它可能不那么显著。这就是为什么那么多学生一犯再犯同样的错误:他们在最后一晚挤出更多学习时间,却以牺牲所学知识的长期保持为代价。显然,额外学习时间对考试本身也有好处;但除此之外,它对健康与智慧都不利。

尖波爆发与长期记忆

在深睡中,可以在海马体记录到 SPW 爆发(sharp wave bursts)。一些研究者认为,这可能是记忆巩固的关键时刻:在这一时刻,海马体作为新皮层的神经训练者,而长期记忆则以跨皮层连接的形式存放在新皮层中。在 SPW 爆发期间,当日经历会通过神经训练以最优方式转移到新皮层网络。随后会启动基因表达与蛋白质合成;这两个过程都需要用来改变长期的突触权重。蛋白质合成构成了能持续数月乃至数年的记忆的开端(如果通过重复/复习维持,例如借助 SuperMemo)。更多细节见:Molecular correlates of the two-component model of long-term memory(Wozniak et al. 1998[123])。如果不能进入睡眠周期的适当阶段,这些长期记忆就无法形成!没有睡眠,你就无法建立长期记忆。此外,如果早晨被闹钟强行打断学习,学习效率也会更低。

用干扰测试检测记忆优化

关于陈述性记忆的所有研究,都可能被睡眠中发生的神经优化所混淆。睡眠常常包含一种「重构」(refactoring):同样的记忆会以不同方式被存储。这样一来,你可能看不到记忆变化的效果,但其内部表征已经改变。这种重构也许无法通过行为测试检测到,或极难被测试出来。存放在工作记忆中的同一个法语词,与存放在长期存储中时的感觉是一样的。它似乎不会一夜之间变形;即便发生变化,也非常难以察觉。然而,缺乏睡眠会对那些存储不够完善的记忆造成更大影响,相比之下,存储已被优化的记忆受影响更小。研究者直到采用干扰技术,才更容易确认睡眠对陈述性记忆的重要性:干扰技术能展示睡眠如何防止记忆被新信息覆盖(Ellenbogen et al. 2006[124])。借助 SuperMemo,可以收集睡眠数据,从而使类似的长期判断成为可能。由于缺乏具有明确睡眠限制的数据,目前我们只知道:随着清醒日间的推进,记忆巩固会逐渐变差(见:睡眠与学习)。

REM 与记忆

关于 REM 睡眠的功能有许多理论。人们早就知道,大多数梦发生在 REM 睡眠中;然而,一些科学家把梦与 REM 睡眠视为两个相互独立、但在时间上重叠的现象。许多实验发现 REM 睡眠对学习很重要,但也有科学家质疑这些发现,指出可能存在实验误差,或指出抗抑郁药虽然是强效的 REM 抑制剂,却并不会损害记忆。一些科学家认为 REM 有助于强化那些较少使用的突触连接;另一些认为它会削弱或删除较少使用的记忆;还有一些认为 REM 帮助大脑从慢波睡眠中恢复,或只是让神经网络为清醒状态做好准备(Klemm 2011[125])。还有人认为 REM 的进化只是为了微调双焦视觉、预防角膜缺氧(眼球运动会搅动房水),甚至恢复椎间盘的液压特性(Fryer 2009[126])。在科学界,仍能零星找到一些人拥护由 Sigmund Freud 发端的旧式精神分析式梦的解释。一些研究者认为,记忆巩固可以在 REM 期间发生;另一些反对;还有一些坚持认为 REM 与记忆无关。一方面,REM 睡眠占比会随年龄下降,这可能表明它与学习需求有关;另一方面,REM 在一夜中所占比例却会增加。有研究者认为,如果 REM 参与记忆,它应该在我们入睡后更快开始。也有人指出,REM 在系统发育上更「年轻」,与记忆和学习相关的最关键功能应当由 NREM 承担。从历史上看,REM 睡眠对记忆与学习的重要性被记录下来,早于我们真正意识到慢波睡眠的作用。因此,与慢波睡眠(SWS)相比,关于睡眠的文章和书籍里到处都是对 REM 在学习中作用的过度强调。随着时间推移,REM 剥夺研究受到了大量批评。如今我们知道:连续不中断的 NREMREM 之间自然、和谐的相互作用,对于记忆、学习与创造力都至关重要(Salzarulo et al. 2000[108])。想了解更多关于睡眠理论(包括 REM 的功能),见睡眠的作用是什么?

REM 与学习

1953 年,Eugene Aserinsky 与 Nathaniel Kleitman 发表了著名论文,证明睡眠由一些阶段组成:在这些阶段中会出现快速眼动,并且可能与做梦相关(Aserinsky and Kleitman 1953[127])。他们当时还不知道这一发现有多么重要。60 年后我们知道,REMNREM 是两种完全不同的大脑状态,它们彼此之间的差异,就像它们与明显不同的清醒状态之间的差异一样大。REM 睡眠在各个脑核团中呈现出截然不同的活动模式;它的特征是信息流向不同;由另一组神经递质释放所主导。

1991 年,Carlyle Smith 展示了:在大鼠的 REM 睡眠窗口期给予蛋白质合成抑制剂,会阻止通常在睡眠后出现的行为改善。这强烈表明 REM 睡眠对记忆很重要(并非所有科学家都同意)。此外,程序性学习的提升会伴随 REM 密度的提升,而这种提升幅度与个体的学习能力成正比(Smith et al. 2004[81])。REM 睡眠的功能不同于 NREM 睡眠。一些研究者认为,REM 可能对程序性记忆更重要(而陈述性记忆在缺少 NREM 时受损更严重)。然而,陈述性与程序性学习之间的分离更可能是解剖学上的(例如小脑 vs. 海马体)。需要注意的是,以鱼类为例,它们并不表现出任何 REM 睡眠的标志,但它们在孵化后显然进行了大量程序性学习(而且很可能在孵化前也已经开始)。

REM 剥夺会按任务复杂度比例削弱学习效果。一些简单任务似乎不受影响(例如被动回避、简单迷宫等)。然而,REM 睡眠剥夺会影响更复杂的任务(例如操作性条件反射、概率学习、复杂迷宫等)(综述见《Sleeping brain, learning brain. The role of sleep for memory systems》(Peigneux et al. 2001[128]))。

在动物世界里,一个经验法则是:新生儿在出生时越不成熟,最初几个月中 REM 睡眠所占比例就越高。就中枢神经系统的发育而言,人类新生儿尤其不成熟。这就是为什么 REM 对婴儿的大脑发育非常重要。新生期的 REM 剥夺可能导致脑质量下降,以及各种发育与行为问题。由于各种形式的压力都会影响睡眠结构,婴儿对任何形式的睡眠中断及其对大脑发育造成的负面影响都尤其脆弱(Peirano and Algarín 2007[129])。把婴儿单独放在小床上任其哭到自止,是一种压力形式,会对大脑造成长期的有害影响。在压力条件下的婴儿小睡,可能不是新生儿典型的 REM 先行模式,而是 REM 缺乏。母亲的缺席会给婴儿带来压力。因此,我主张按需睡眠与按需喂养,并为婴儿进行同床共睡

我的一些 SleepChart 数据似乎初步暗示:REM 睡眠也可能影响简单的陈述性记忆(例如使用 SuperMemo 学习)。在 SleepChart 中无法记录 REM 睡眠,因此无法确定。然而,推迟入睡以及被闹钟打断的睡眠,很可能都属于 REM 缺乏。我(目前)还不知道 REM 缺乏的一夜会如何影响睡前发生的学习;但可以确定的是,REM 缺乏的一夜会降低次日的学习表现。如果是闹钟打断,很难说到底是什么造成了表现下降;但若是推迟入睡,唯一可设想的替代解释就是自然睡眠总量更少。我倾向于相信,造成表现更差的原因是 REM 的稀缺。因为存在一些自然的短夜睡眠,反而会带来极佳的学习结果。

既然 NREMREM 是两种完全不同的大脑状态,那么它们各自承担什么角色?结合近期关于 NREM 睡眠在学习中作用的发现,REM 可能扮演什么角色?它除了外观上同样处于休息状态之外,与 NREM 并无相似之处。一个重要线索来自这样一个事实:NREMREM 会在一夜之间不断翻转。一次 REM 会增加对 NREM 的需求,反之亦然。这两个睡眠阶段具备生物控制系统中常见的互补过程的所有特征:它们像清醒与睡眠一样以翻转方式运作;它们像合成代谢与分解代谢通路一样相互对抗并进行补偿;它们像心脏的心房与心室一样同步协作。这暗示着互补功能;而大量研究发现似乎表明,这些功能围绕着学习与记忆展开。

REM 作为一种神经训练

有一种假说认为,REM 睡眠是一种对大脑的训练。正常的清醒活动会用新的活动模式训练海马体;而 REM 睡眠也做同样的事,只不过它使用的是想象出来的、随机化的假设模式。仿佛大脑在清醒中还不够,它需要在睡眠里进行更多、更特殊的训练。这种额外训练将很有价值,因为它的成本很低(无需消耗行为能量),并且能够利用大脑中已存储的信息。例如,在 REM 睡眠中,大脑可能生成一个假设情境:我们犯了一个简单却代价高昂的错误。大脑会随后重演这个假设情境,并寻找可能的情节与可能有益的结论。也许我们会在意识到损失代价时满身冷汗地醒来,并采取必要措施。很多时候,解决方案会荒诞不经;这或许应当被理解为:我们不该过度解读梦。科学家注意到,一些网络会在 REM 中重放其清醒时的活动模式,但这些并不是对当天情景记忆的简单重演;当天经历只会为梦提供稀疏的灵感。

就像给计算机编程比让它从现实情境中学习更容易一样,在 REM 睡眠中向海马体及其他结构加载新记忆更容易、更快速。每次加载新的关联之后,大脑都需要把信息重新分配到其新皮层的长期存储中——这就是前文所述的 NREM 睡眠功能。经历许多个小时的清醒之后,我们需要超过 1 小时的 NREM 睡眠;然而,似乎只需要几分钟的 REM 就能让天平重新倾向于 NREM。这个循环不断重复。

REM 与创造力

随着夜晚推进,REM 更多,而 NREM 更少。如果「REM 训练」假说为真,这可能意味着:夜越深,生成新信息越困难。也可能意味着:每一段 NREM 都不完整,未被处理的信息残余会持续阻碍 REM 的完全展开,直到凌晨时分。或许,REM 的昼夜节律倾向为旧信息的存储与新信息的综合提供了平衡,并在睡眠后段逐渐向后者倾斜?如果以上情景都成立,我们就会疑惑:为什么大脑不会以最后一次 NREM 片段结束睡眠,从而以「清空状态」醒来?也许,向清醒的过渡本身就足以清理那些停留在工作记忆里、刚刚「发现」的新信息残余?又或者,最后一段 REM 带来的新加载具有特殊的生存价值?这些可能正是那种清晨的创造性洞见的基石——科学史对此极为丰富。很可能,睡眠的最后一段、以 REM 结束的片段,为清晨的大脑带来了下一个伟大想法。一些支持这一观点的证据来自 Walker:他在研究不同睡眠阶段被唤醒的受试者在字谜(anagram)谜题中的表现时收集到了数据(Walker et al. 2002[130])。到 2010 年,关于 REM 在创造力中作用的更多证据被收集。如果关于最后一次 REM 片段对创造性贡献的推理成立,我们可能会得出一个戏剧性的结论:

闹钟是现代世界扼杀伟大创意的头号杀手

压力与「鼠辈竞赛」(rat race)同样会削弱人类创造力,但要获得良好睡眠并控制压力,比在一个毫无压力、却睡眠不足的世界里产出伟大创意要容易得多。研究者与教育者在淡化闹钟造成的伤害时应当非常谨慎(见:Jim Horne 与 Daniel Kripke)。父母也应对那些早晨无法起床去上学的孩子更宽容。

更多内容见:自然创造力周期

REM 作为神经优化器

如果 REM 只是睡眠中的一种训练或创造性选项,那么我们为什么会出现 REM 缺口REM 的昼夜节律倾向可能在 NREMREM 之间提供平衡;NREM 的稳态压力可能来自学习(发生在清醒或 REM 中)。然而,稳态的 REM 睡眠倾向,以及在 REM 剥夺后出现的 REM 睡眠反弹,都似乎表明 REM 远不只是一个选项。REM 剥夺对复杂任务与程序性记忆的复杂影响,可能体现了 REM 睡眠更重要的功能:其中神经优化以「相较于 NREM 睡眠,大脑信息流方向的反转」为基础。有可能 NREM 只是长期记忆存储的工具,本身并不太具备优化网络布局的能力;NREM 也许只是一个抗干扰工具。然而,睡眠确实会帮助组织记忆、提升抽象程度、降低存储成本。也许,这种优化角色完全由 REM 睡眠承担。也许,伪模式训练(pseudopattern training)使得我们能够把跨广泛网络、成本高昂的记忆,迁移到更小、更具概括性的回路之中。一个重要线索来自婴儿睡眠:由于新生儿探索世界的能力有限,REM 睡眠的探索性功能可能在发育中扮演关键角色。然而,Siegel 博士注意到,人类花在 REM 上的时间与其学习能力并不高度相关。我认为,这类不一致可以由个体差异很好地解释:差异不仅体现在学习能力或每晚平均 REM 时长上,也体现在 REM 的效率上(即学习与 REM 的比率)。这类似于我们的消化能力:有些人可以大吃特吃却全都排出去;另一些人吃得很少却仍能把营养榨取到最后 1 毫克(并因此发胖)。如果进一步看不同物种,我们会发现 REM 时长与「动物智商」之间的联系更弱。这或许可以解释为:聪明动物能从 REM 睡眠中提取远更多的价值。换言之,再多优化也无法在小容量网络里创造奇迹。更令人不安的说法是:在鲸类中很难检测到任何 REM,尤其是幼体(Castellini 2002[131])。如果本章所描绘的那样,REM 对程序性学习至关重要,那么它在年轻、聪明、以捕食为生的游泳者身上似乎不可或缺。显然,作为相对较新的进化实体,基于 REM 的神经优化可能存在不同表型的变体,而研究者并不一定能立刻察觉。此外,鲸类睡眠具有单半球慢波睡眠这一奇迹,并在超过 5000 万年的时间里发展出与人类 REM 睡眠截然不同的特征。相较于 REM 睡眠存在的历史长度,这是一段相当可观的比例。

睡眠中的突触变化

一些研究显示突触在睡眠中会被增强,而另一些研究发现相反的效应。总体突触强度在清醒中往往倾向于增强[132],而学习能力却持续下降。清醒会在所有行为状态中提高皮层放电频率(Tononi et al. 2009[133])。睡眠中选择性突触同时出现削弱与增强,最好的解释可能是:一夜之间发生了某种记忆重排。这并不与睡眠的记忆巩固功能相矛盾;也不与我们在清醒日间学习能力倾向于下降这一事实相矛盾。

在研究睡眠中突触强度变化时,我们总需要区分:

  1. 短期记忆:由于一天的学习而导致的突触传导性短期增加

  2. 长期记忆:回忆较旧记忆的能力(例如可用 SuperMemo 来测量)

打个比方,大脑就像一台计算机:白天不断把数据块加载到内存里(短期记忆)。随着内存被填满,计算机会变慢,所有应用都会卡到停滞。然而,如果你去测试单个存储单元,你会发现它们牢牢抓住新数据。夜晚,计算机会逐步整理这些数据块,移除不一致与重复,把记忆写入硬盘(长期记忆),并执行碎片整理以便快速访问。我们需要寻找这一隐喻在神经生理学上的对应物,以及清醒期间回忆能力走弱的最可能解释——因为清醒时突触传导性上升、以及日间学习能力下降,都有充分记录。最连贯、最有吸引力且支持证据最充分的假说认为:短期、低干扰网络的过载,是清醒日间记忆容量下降的原因(见:NREM 与记忆)。这种下降会削弱工作记忆,从而影响人类认知能力的整个谱系。于是,睡眠的主要功能就会是重新分配、再巩固并优化那些会拖慢进一步学习的短期记忆。

至于睡眠中突触强度下降这一点,它也很契合现有的睡眠与学习模型。睡眠的主要功能之一,应当是优化记忆存储:把记忆以最有效的方式表征,使它们最抽象、占用最小空间、产生最少干扰等。这个过程确实应该降低记忆的总体成本,并导致冗余突触连接被削弱。

Tononi 博士认为,清醒活动会造成突触权重的整体上升,而睡眠可能需要用来抵消这种上升。假设的下调(downscaling)会发生在慢波睡眠中(Tononi and Cirelli 2006[134])。Tononi 博士把记忆层级中彼此差异很大的成分聚在一起:从短期(磷酸化)、到长期(AMPA 转运)、再到重塑(萌芽);而我更愿意把赌注押在日常学习与短期记忆上。整体皮层下调或许可以漂亮地表达一种学习后的清理过程,并与 Crick 与 Mitchison 的观点相一致。这种清理也可能与由短期记忆结构(例如海马体、杏仁核等)所主导的选择性突触增强结合在一起。

让我们考虑著名的 Halle Berry 神经元:这是一种海马体神经元,在训练中接触到 Halle Berry 图片后,可能会选择性地对所有与 Halle Berry 相关的刺激做出反应。训练期间被增强的所有皮层神经元,最好在慢波睡眠(SWS)过程中被静默;唯一的例外是:从海马体关联中被重构出来、稀疏编码的 Halle Berry 表征(包括 HB 神经元)被迁移到一条皮层捷径上。这个过程会释放海马体的学习容量,产生整体下调,同时仍保留新学信息中那部分稀疏编码的片段。

你可能知道,SuperMemo 是建立在「记忆会随时间削弱并被删除」这一主张之上的。这种削弱并不是指睡眠中短期记忆的丢失,而是指记忆在数月乃至数年尺度上的长期衰退。Tononi 博士提出了遗忘理论的一种变体:他认为睡眠中的突触下调会按现有突触强度的比例进行,因此最弱的突触会失去其记忆痕迹。除非 Tononi 的主张能够展示下调过程如何需要全网络范围的计算操作,否则它可能很难通过关闭测试——因为还存在一种更简单的「分子遗忘时钟」解释,如《Molecular correlates of the two-component model of long-term memory》(Wozniak et al. 1998[123])所述。然而,需要注意的是,Tononi 经常谈论的是睡眠前一天登记的短期记忆痕迹,而不是我们用记忆双成分模型术语所称的**记忆可检索性**——它往往会在对所学材料复习之间以指数形式衰减(Wozniak et al. 1995[5])。Tononi 发现:大脑被激活的部分在接下来的一夜里表现出最多的慢波活动。在陈述性与程序性学习中,皮层慢波活动(SWA)的增加具有局部特异性,并与学习程度及隔夜改善成正比(Tononi et al. 2004[135])。Tononi 用「下调主要影响变化最大的脑区」来解释这些发现。然而,另一种可能解释是:这些脑区在睡眠中之所以被再激活,是因为短期存储在海马体中发生变化,以反映当天经历。海马体可被视为一种短期记忆网络,用来训练皮层回路。与其说它们被削弱,不如说选择性突触可能实际上会被增强;而皮层中刺激传播的减少(Massimini 记录到这一点,见 Tononi et al. 2005[136])可以用如下需求来解释:记忆需要被铺设出来,但不需要随后的创造性与联想性刺激传播去激活更多突触。整体下调会影响所有新近增强、且不会受到海马体强化的突触。

想深入了解睡眠机制的一个优秀材料是:Tononi 博士在 2011 年 Allen Institute for Brain Science Symposium 的讲座

Ribeiro 与 Nicolelis 认为:REM 中与经验依赖性可塑性相关的基因表达,与 Tononi 的突触下调相容。然而,下调应当只影响那些未被清醒经验激活的回路。换言之,上调会影响被激活的回路,而下调会影响不活跃的回路。这会提高睡眠中记忆巩固的信噪比(SNR)(Ribeiro and Nicolelis 2004[137])。Walker 博士认为,上调与下调过程可能会以互补方式在睡眠中同时发生:「稳态的突触下调可能会移除多余的神经连接,从而提升 SNR;然而,对经验依赖性回路进行神经再激活与强化(在不移除冗余突触连接的情况下进行)同样可能提升 SNR。因此,这两种机制虽不同,却可能产生相似结果:提高记忆表征的保真度。」(Walker 2009[138])。

本文作者认为,这个过程可能更具普遍性,并且会涉及长期记忆——它们可以作为一种结构蓝图,用于重新编织从短期记忆中收集到的、经过新优化的记忆织物。这意味着,上调还会涉及那些未被经验激活的新皮层新神经元。这一信念来自一个简单需求:招募新的皮层突触,以承载那些将在数月乃至数年内通过经验依赖方式被巩固的长期记忆;而这一巩固过程可以依赖一种并不依赖睡眠的简单分子机制。换言之,新皮层突触的招募在很大程度上依赖睡眠;下调与学习后的清理相关;而记忆稳定性的建立则是一个在记忆痕迹生命周期中,依赖于清醒和/或睡眠中的再激活的过程(Wozniak et al. 1995[5])。

记忆优化

在围绕一个问题辛苦工作一天之后,如果挫败感出现,而问题看起来无解或极其复杂,我们的工作记忆可能会感觉被一些无法落入连贯结构的信息碎片堵住了,因而找不到解决方案。然而,在一夜恢复性的睡眠之后,我们可能会突然灵光一现!这不一定是因为精神更清爽或早晨思考更多;很多时候,我们在醒来时灵感就已经在那里了,仿佛大脑在我们不参与意识的情况下整夜辛勤工作。负责这种神奇洞见的过程是神经优化

尽管与睡眠相关的生物功能清单很长,但睡眠为了一个主要目的而进化:优化储存在大脑神经网络中的记忆。这一功能如此关键,以至于任何复杂神经系统都无法在缺少它的情况下生存。这就是为什么所有复杂动物都会睡眠(尽管并不总是容易判断(Siegel 2008[139])。甚至蚂蚁也会小睡。

皮层的大小是固定的,这意味着它在能存储多少信息方面存在解剖学与功能上的限制。不要相信那些助记大师告诉你的「我们能记住一切」,只需要一种「访问隐藏记忆的方法」。为了维持形成新记忆的能力,皮层必须不断重做其表征,以确保只有最突出的记忆会被长期保存。认为睡眠有助于这一过程的观念,与我们认识到大脑参与思考与记忆一样古老。不过,仍有研究者难以将学习与无意识状态调和起来

海马体损伤

1953 年,Henry Gustav Molaison(又名 H.M.)的内侧颞叶部分组织被双侧切除。术后,H.M. 失去了形成新的长期记忆的能力,同时保留了 1953 年之前的记忆、程序性学习能力以及基于皮层的工作记忆容量。这使研究者发现海马体在人类大脑学习回路中的关键作用。海马体从几乎所有皮层区域接收丰富连接,并向同一批皮层区域的目标反馈。这意味着,它那密集的连接网络能够保留皮层当前激活模式的快照,也能够把同样的模式投射回皮层。记忆一旦形成,它们会在数天内依赖海马体。这提示:记忆可能需要在之后被迁移回新皮层的不同区域。由于睡眠剥夺会影响这一过程,很早就有人提出:睡眠可能在这一过程中发挥作用。大脑中其他连接同样丰富的区域,在各类特化记忆中也承担类似角色。多年之后,随着来自不同领域的研究者陆续贡献,「记忆转移」的目的才逐渐清晰。

海马体损伤为如下观点提供了非常强的线索:短期记忆向长期记忆的转换是计算性的,而不只是分子/突触层面的过程。这也暗示:在转换之后,记忆的性质与布局会有所不同。

时间分级的逆行性遗忘

当海马体受伤时,除了无法形成新记忆(顺行性遗忘)之外,既有记忆也会出现一定程度的丢失(逆行性遗忘)。早在 1881 年,Théodule Ribot 就提出:逆行性遗忘中更近的记忆更可能丢失(Ribot 定律)。按「新近程度」比例丢失记忆的现象被称为「时间分级的逆行性遗忘」。关于这一现象有许多解释假说,其中一些错误地把海马体牵涉到「其中一些记忆的长期存储」过程中,认为这些记忆会逐步被巩固进长期存储。另一些解释则认为,记忆会在网络中发生逐步的物理转移(例如一层又一层地整合神经细胞层),这个过程可能持续数年。对于熟悉长期记忆双成分模型(Wozniak 1995[5])的人来说,很明显:海马体病变在「时间分级的逆行性遗忘」中的参与,并不必然意味着这一结构在长期存储记忆中发挥作用。它同样可以由海马体参与再巩固过程来解释:再巩固过程服务于记忆稳定性的建立。海马体并不需要慢慢巩固存放在自身连接中的记忆;只要它像最初建立皮层连接那样,通过复习参与这些记忆的再激活就足够了。这样一来,在逆行性遗忘中,稳定性更低的记忆会最先丢失。验证这一点的一个简单方法,是追踪遗忘随时间的进程(例如借助 SuperMemo 持续多年记录)。如果海马体对记忆稳定性的建立必不可少,那么遗忘的程度应当会随着自然遗忘过程而逐渐变得更糟。由于缺少新记忆带来的干扰,这种遗忘可能不会像健康大脑那样快。

如果上述关于「时间分级的逆行性遗忘」的解释正确,它将进一步提示海马体在建立新记忆、并随时间构建记忆稳定性方面的角色。这会强化如下观念:海马体是皮层中陈述性记忆的主要入口,并再次强调该过程的计算性方面。

睡眠中的记忆处理

1963 年,Sokolev 提出,大脑的主要力量在于建立周围世界模型的能力。然而,人们一直难以弄清:进入感觉输入的一团混乱数据,如何被重塑为人类心智中抽象形状与模型的奇妙世界。1970 年,Marr 提出睡眠中的记忆巩固可能是一种把经验归类的归纳过程,该过程基于对环境的统计抽样。Marr 认为,海马体会存储白天获得的经验,并在夜间将其回放到新皮层;而类别形成会发生在回放的过程中。1979 年,Wickelgren 提出:海马体需要为输入的新组合分配皮层表征。随后,新皮层可以把这些组合分别对待(例如像 SuperMemo 中的新条目一样)。1992 年,French 注意到,人类很少会「灾难性遗忘」。为了解释这一点,他提出:为了防止灾难性遗忘,大脑的神经网络在学习过程中需要分离其内部表征。

灾难性遗忘

1995 年,在 Squire 关于遗忘的工作及其关于内侧颞叶皮层参与记忆巩固的假说(Squire et al. 1984[140])启发下,McClelland、McNaughton 与 O'Reilly 综合更早的理论,提出大脑通过进化出两套相互分离的记忆系统来应对灾难性遗忘问题:用来把新表征与既有记忆分开,即一个双网络理论系统。他们为该理论提供了计算框架。在所提出的互补编码模式中,海马体与新皮层分别扮演双网络系统的角色。通过神经网络仿真,研究者展示了他们对「时间分级的逆行性遗忘」如何发生的解释(仍然把海马体牵涉为可能的长期存储)(McClelland et al. 1995[141])。

2001 年,French 等人提出:伪模式(pseudopatterns)可以作为在神经网络之间传递信息的一种方式(French et al. 2001[142])(简化如下):

「某个神经网络已经学习了一组与某个潜在函数 f 对应的输入-输出模式。我们如何得到原始函数 f 的一个近似?一种解决方案是:向网络输入随机输入,并观察对应输出。这样我们就创建了一系列伪模式 ψi,其中每个 ψi 由一个随机输入以及该输入经过网络后的输出定义。伪模式最早由 Robins 引入,用于克服灾难性干扰。Robins 提出:当网络需要学习一个新模式时,先生成若干伪模式。随后,网络不只学习新模式 P,而是学习「新模式 + 一组反映其先前所学的伪模式」。如此一来,新模式会与一些模式交织在一起;这些模式尽管不是最初学到的模式,却仍然反映了所学习到的原始函数。Robins 证明,他的技术确实降低了灾难性干扰。」

睡眠中的两阶段记忆处理

海马体设想为一种对皮层激活状态进行快照的装置,看起来是一个有吸引力且似乎合理的命题。这些快照可以在 NREM 中拍摄,并在 REM 的训练模式中回放到新皮层。一些神经元放电实验似乎甚至暗示了这样的可能序列。然而,Georgi Buzsáki 博士得出结论:该过程实际上在性质上是反向的。同样,实验测得的神经元放电序列对他得出这一结论至关重要。

1989 年,Pavlides 与 Winson 证明:在学习片段中活跃的海马体神经元,在随后的睡眠中会更加活跃(Pavlides and Winson 1989[143])。同一年,Buzsáki 提出:海马体尖波爆发(在深睡中很丰富)可能代表一种机制,用于巩固海马体内与海马体外回路中的表征,并把记忆从海马体转移到新皮层(Buzsáki 1989[4])。Buzsáki 的观点使人们相信,SPW 会导致细胞集合的再激活,而这些集合此前已被探索性活动(经验或 REM 睡眠)所增强。

Alexander Luria 的学生、Sokolev 的弟子 Olga Vinogradova,在她 72 岁去世前一周获接受的最后一篇论文中,总结了她 35 年关于海马体功能的研究,题为《Hippocampus as Comparator: Role of the Two Input and Two Output Systems of the hippocampus in Selection and Registration of Information》;该论文将海马体描绘为主要的新奇检测器,并对其在记忆优化中的作用具有深远启示(Vinogradova 2001[144])。

然而,Buzsáki 提出了一个模型:在该模型中,内嗅皮层才是比较器(Buzsáki,未发表,2000)。他假设内嗅皮层会按如下方式帮助系统检测新奇:

「EC 作为一个『比较器』运作,用于评估新皮层表征与海马体传递的反馈信息(重建后的输入)之间的差异。得到的差异或『误差』被视为『新奇』;正是这一新信息启动了海马体网络中的可塑性变化(误差补偿)。海马体中突触连通性的改变会进一步产生新的海马体输出。在该过程中,海马体生成彼此分离(独立)的输出,即最小化其输出之间的互信息。海马体的输出反过来训练长期记忆痕迹,使它们之间的互信息传递最小化。当长期记忆被正确训练后,海马体输出将不再影响 EC 中的突触权重。这一特征由模型的自联想性质体现:海马体提供重建后的输入(自联想),而输入与重建输入之间的差异驱动长期记忆的训练。由于只有重建误差进入海马体,一个相对有限的计算网络就足以在 EC/新皮层中训练长期记忆。」

根据 Buzsáki 的观点,记忆优化可以在海马体的中介下执行,海马体会工作于:

  1. REM 睡眠期间的探索模式(其中新皮层信息用于训练海马体回路),以及

  2. NREM 睡眠期间的摄取/睡眠模式(其中海马体用于训练新皮层回路)。

网络优化假说可以解释:为什么在睡眠剥夺中很难检测到机械记忆(rote learning)退化。按上文定义的 NREM/REM 相互作用,对同一输入所产生的输出(针对低层级关联,如刺激配对)应当影响较小。要检测睡眠剥夺造成的损害,应当使用更复杂的测试。的确,Carlyle Smith 博士的一些研究已经能够展示:REM 睡眠剥夺(REMD)对配对联想学习的影响(在 REMD 中几乎不受损)与对复杂逻辑任务的影响之间存在差异,而后者受 REM 睡眠剥夺的影响最大(Smith 1993[145])。

Buzsáki 模型基于这样一个观点:大脑在睡眠的 NREMREM 阶段中,信息流向会发生变化。对信息流的控制可能部分是系统性/神经性的,部分是神经激素性的。像东莨菪碱(scopolamine)这样的抗胆碱药物会导致一种伴随幻觉、焦虑与虚构记忆(confabulations)的谵妄性清醒状态(Perry and Perry 1995[146])。AIM 模型描述了多种围绕调制轴及其胆碱能维度旋转的大脑状态;该维度对睡眠中的记忆优化至关重要(Hobson et al. 2000[79])。REM 与清醒中的胆碱能调制,可能帮助海马体回路加载新记忆;而单胺能主导则会反转信息流,增强记忆在新皮层中的编码,同时抑制海马体编码(Hasselmo 1999[147])。

优化记忆

我们现在可以得出结论:在睡眠中,记忆会从一种临时的、容量低、编码快、关联性高、抗干扰强的存储,迁移到这样的区域:在不太受新到达记忆数据的干扰的情况下,它们可以基于自身的新颖性与适用性,以很低成本被安全使用数月乃至数年。抽象模式会被提取,而遮蔽整体图景的细节会被丢弃。网络的重新接线可能带来如下优势:

  • 将低关联的记忆转化为高度关联的记忆(古老说法的起源:let me consult my pillow)

  • 消除知识干扰,以帮助避免相近概念之间的混淆

  • 提取对象的共同属性并建立模型(用图像化的方式说:与其保存某人脸部的 100 张照片、每次遇到都逐一搜索,不如识别共同的模型特征并在毫秒级完成识别)

  • 优化程序性反射(一些研究者甚至提出,REM 主要针对程序性技能的巩固;而程序性技能似乎在 REM 剥夺中受损最严重;相比之下,NREM 睡眠只服务于陈述性技能的巩固)

  • 将记忆从过载的回路(例如海马体)转移到新皮层中更宽敞的区域

更多内容见:Neurostatistical Model of Memory

垃圾回收

网络优化不仅是一个确保记忆长期可用的过程,也是一个关键的清理机制,它确保工作记忆存储不会受到数据堆积的影响。在记忆任务中,我们可以看到前额叶皮层活动与困倦程度之间的相关性。与双网络理论一致,一旦短期记忆存储开始填满,就会启动一种补偿机制:皮层可能会暂时被用来协助完成记忆任务。威斯康星大学的 Giulio Tononi 提出:网络过载会让维持大脑变得越来越昂贵(见:睡眠中的突触变化)。因此需要睡眠来进行突触下调。这些下调观点给睡眠研究带来了一些困惑:一些发现指出突触连接在睡眠中会被增强,而另一些研究者注意到了相反效应。如果睡眠是神经优化器,我们就应当预期某些连接会变弱,而另一些连接会变强。Marcello Massimini(Tononi et al. 2005[136])使用 TMS 观察:清醒与睡眠时,皮层某一区域的激活会如何传递到大脑其他区域。他注意到,在 NREM 睡眠中,初始反应非常强,但很快就会熄灭,并且不会传播到刺激点之外太远。与 Evans 或 Crick 理论一致,Massimini 注意到睡眠中突触连接的削弱。这可能与 Tononi 的整体下调观察相一致;然而,图景也可能被神经调制的效应所混淆,因为神经调制会改变睡眠中网络运作的模式。清醒与睡眠大脑中的信号传播视频可在这里观看。

尽管 Tononi 与 Massimini 提出了睡眠中的突触下调假说,其他科学家也提出并通过实验证明:慢波睡眠同样可以增强突触连接(Lee and Wilson 2002[148];Sejnowski and Destexhe 2000[149];Steriade and Timofeev 2003[150])。睡眠剥夺会导致更高的皮层激活,并增加在解决复杂任务时被激活的脑区数量(Drummond et al. 2000[151])。Tononi 把这些结果解释为:清醒过程中突触权重整体上升的效应。权重上升会导致总体激活更高。然而,激活模式的迁移(例如从颞叶到顶叶)可能表明原因略有不同。看起来,大脑会招募新的皮层区域来补偿那些无法应对额外编码与处理的过载网络。这一观察对于判断睡眠过程在多大程度上是一种网络涌现现象至关重要——正如 KruegerTononi 的假说所建议的那样;以及它在多大程度上需要中央控制,才能在 NREM-REM 序列翻转的相互作用中完成其计算角色。

单半球睡眠

在发展出单半球睡眠的海豚与鸟类身上,会出现一个有趣的问题。这种睡眠形式对存储优化来说应当不是最优的。它可以类比为磁盘碎片整理:只有一半磁盘空间可用于磁盘整理。这样的过程可能非常有益;但若要逼近「全存储优化」的最优状态,每一次质量度量上的小幅提升,都将需要指数级更多的时间。最重要的是,我们可以预期更强的半球专门化与更弱的半球间通信。显然,在危险、迁徙等情境下,单半球睡眠作为一种临时措施会很宝贵。

如果「向单半球睡眠演化」这一步看起来很复杂,只要注意到:切断了胼胝体的猫,可以在一侧半球处于 NREM 睡眠的同时,另一侧半球处于清醒状态。换言之,阻断半球间通信可能就是产生半球不同步所需要的一切。轻松一点地说,如果采纳者形成一个隔离种群,多相睡眠者的努力甚至可能在人类身上带来类似适应。不过,这大概需要数千年以及许多进化代价,多相睡眠者才可能最终「适应」并获得单半球睡眠能力。

睡眠中的问题求解

受「睡眠中的神经优化」概念启发,多年前我发展出了我自己的问题求解公式。每当我需要为一个被过多矛盾信息搅浑的复杂任务找到解决方案时,它都对我有效。睡眠解决了一半!我的公式如下:

  1. 睡好觉:在正确相位、且不受任何人为控制的情况下睡觉至关重要!(见:自由运行睡眠

  2. 思考问题:我该如何解决?哪些信息能帮助解决?这一步需要与外界 100% 隔离。在大自然中,或只是沿着房间来回踱步,都效果极佳。

  3. 阅读与问题相关的内容,直到大脑发烫。借助神经创造力渐进阅读,真的可能需要 1–2 小时把工作记忆加载到容量上限,并把大脑推到精疲力尽。同样,这一步需要尽可能少的打断,以确保对问题 100% 聚焦。不能有任何一个脑细胞被世界冲突吸走注意力;所有资源都必须投入到问题求解。

  4. 运动:为了刺激循环、为懒散无结构的思考提供时间,并填满下一次更合适的睡眠片段之前的时间,我会运动。我认识很多人完全不运动也能成功解决问题,所以这可能只是我个人可选的偏好。我认为,让大脑在对问题的专注上保持纯净很重要。只有在严重卡壳或思维阻塞、解决方案尤为难觅的情况下,我才会用无关信息来「污染」心智。

  5. 回到第 1 步,然后你会发现上一轮把你的思考推进了一大截,而睡眠部分对看清整体图景至关重要。午睡很棒,因为它在循环中的作用与夜间睡眠同等重要。遗憾的是,我们似乎被设计成每天只午睡一次。也许一天多次午睡能带来更多创造性步骤(如果可行的话)。

面对困难问题,时间是盟友!你能运行的「思考-学习-睡眠」循环越多,就越接近目标。保持心智纯净至关重要;但偶尔为无关信息处理而休息一下,也能疏通大脑中带有偏见的通路。

关于我的问题求解公式,见:如何解决任何问题?

结论

在清醒的探索性活动中,大脑的联想网络(包括海马体)会把来自皮层各处的信息,与来自高度处理的感官输入的新信息整合起来。皮层处理负责工作记忆与思考,而联想网络则持有近期活动模式。清醒期间,皮层网络会被增强的连接所过载,而海马体会被新的联想模式所过载。在 NREM 睡眠中,皮层处理被抑制,皮层整体去增强(depotentiated),海马体模式被用来将新获得的信息与先前存储在皮层中的长期记忆整合。REM 睡眠则用于用来自皮层的新模式训练海马体网络;这一过程可以类比为一种「模拟清醒」。这些新模式随后会在下一次 NREM 片段中被转移回新皮层。NREM-REM 的相互作用用于将知识从细节丰富的模式重塑为更一般化的模式。这种相互作用在一夜之间重复多次,正是它让我们变聪明。它帮助我们用少量信息获得最大效用。经常使用的模式会通过逐步建立其突触稳定性在皮层中被强化;而突触的可检索性会以负指数方式衰减,以最大化记忆效用并最小化存储成本(Wozniak 1995[5])。

睡眠是神经计算的巅峰成就。有了良好睡眠,人类大脑就是一台高效的问题求解机器